معرفی داده کاوی
دادهکاوی به انگلیسیData Mining به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از شرکتها و موسسات دارای حجم انبوهی از اطلاعات هستند. تکنیکهای دادهکاوی به طور تاریخی به گونهای گسترش یافتهاند که به سادگی میتوان آنها را بر ابزارهای نرمافزاری و … امروزی تطبیق داده و از اطلاعات جمعآوری شده بهترین بهره را برد.
در صورتی که سیستمهای دادهکاوی بر روی سکوهای Client/Server قوی نصب شده باشد و دسترسی به بانکهای اطلاعاتی بزرگ فراهم باشد، میتوان به سوالاتی از قبیل :کدامیک از مشتریان ممکن است خریدار کدامیک از محصولات آینده شرکت باشند، چرا، در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.
موفقیت داده کاوی در گرو بهرهگیری از کارشناسان فنی و تحلیل گران کار آزمودهای است که از توانایی کافی برای طبقهبندی تحلیلها و تغییر آنها برخوردار هستند.
بهرهبرداری از داده کاوی در دو بخش دولتی و بخش خصوصی رو به گسترش است. صنایعی چون بانکداری، بیمه، بهداشت و بازاریابی آنرا عموماً برای کاهش هزینهها، ارتقاء کیفی پژوهشها و بالاتر بردن میزان فروش به کار میبرند.
کاوش در دادهها بخشی بزرگ از سامانههای هوشمند است. سامانههای هوشمند زیر شاخهای بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی هستند که خود زمینهای در هوش مصنوعی است.
داده کاوی منحصر به گردآوری و مدیریت دادهها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل میشود.
داده کاوی مرحلهای در روند کشف دانش در پایگاه دادهها براساس الگوی هرم داتش ذیل میباشد.
مراحل دیگر در روند سا خت سیستم های مدیریت اطلاعات به صورت تصاعدی شامل، پاکسازی داده، انتخاب داده، انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه دانش میباشد. بسیاری از پیشرفتها در تکنولوژی و فرایندهای تجاری بر رشد علاقهمندی به داده کاوی در بخشهای خصوصی و عمومی سهمی داشتهاند.
کاربردهای داده کاوی
کاربردهایی که برای داده کاوی وجود دارند، بسیار بسیار گسترده اند و ما در این نوشتار، فقط امکان معرفی تعداد محدودی از آن ها را داریم. به عنوان مثال های بیشتر، می توان به کاربردهای داده کاوی در زمینه های زیر اشاره کرد:
- سیستم های مدیریتی، مثلا مدیریت ارتباط با مشتریان یا CRM
- نرم افزارهای امنیتی، مثلا نرم افزاری مانیتورینگ شبکه و ویروس کش ها
- سیستم های بانکی، مثلا تخصیص اعتبار به مشتریان و طبقه بندی آن ها
- مالی و اقتصادی، مثلا پیش بینی قیمت یک یا چند سهام یا شاخص
- برنامه ریزی و مکان یابی، مثلا چینش داخلی فروشگاه های بزرگ و یا تخصیص امکانات شهری
- علوم پزشکی، مثلا پیش بینی خطرات احتمالی ناشی از یک عمل جراحی خاص
- علوم اجتماعی و سیاسی، مثلا پیش بینی یا تحلیل نتایج انتخابات
خدمات ما در حوزه داده کاوی
انجام پروژه های داده کاوی (Data Mining) در زمینه های
طراحی و پیاده سازی سیستم های مدیریت و مستند سازی داده ها
- رده بندی (Classification)
- خوشه بندی (Clustering)
- پیش بینی (Prediction)
- متن کاوی(Text mining)
- انتخاب ویژگی (Feature Selection)
- قواعد انجمنی (Association Rules)
با استفاده از تکنیک های ذیل
- شبکه عصبی مصنوعی(ANN)
- شبکه های عصبی فازی (ANFIS)
- سری های زمانی
- رگرسیون خطی، غیر خطی، تک و چند متغیره و رگرسیون لجستیک
- درخت تصمیم با شاخص جینی و آنتروپی
- بگینگ و بوستینگ
- ماشین بردار پشتیبان
- سیستم استنباط بیزین
- الگوریتم ژنتیک , ازدحام ذرات
- الگوریتم های فراابتکاری
- قواعد همسایگی با fp-growth, apriory
- تحلیل نتایج با رسم نمودار Roc
- انواع مختلف روش های انتخاب ویژگی:شاخص ریلیف، ازدحام ذرات،شاخص جینی و …
- انواع روش های نمونه برداری و بیش نمونه گیری
- روش های حل مشکل رده نامتوازن
- تشخیص داده پرت
- تشخیص داده پرت محلی
با استفاده از نرم افزارهای
- IBM SPSS Modeler
- رپیدماینر
- وکا
- R
- SAS